Skip to main content

Python SDK

版本记录

版本说明日期
V1.0.5修复消息事件中 DataSourceId 参数错误的问题,维度表上报时删除多余参数2023-12-01
V1.0.2支持埋点事件事件变量、用户变量可传列表类型2022-04-20
V1.0.1支持埋点事件可传eventTime参数2022-04-02
V1.0.0支持自定义事件,用户属性事件2022-03-28

简介

GrowingIO 提供在Python Server端部署的SDK,方便集成后可以快速的进行事件上报操作。

兼容 Python2.7+ 和 Python3.5+.

集成准备

获取SDK初始化必传参数:AccountID、DataSourceID、ServerHost

info

AccountID:项目ID,代表一个项目
DataSourceID:数据源ID,代表一个数据源
ServerHost:采集数据上报的服务器地址,非平台地址

AccountID、DataSourceID 需要在CDP增长平台上新建数据源,或从已创建的数据源中获取, 如不清楚或无权限请联系您的专属项目经理或技术支持

创建
查看

下载 & 安装

可以使用 pip 下载我们的sdk

pip install growingio_tracker

使用说明

初始化参数

参数必选类型默认值说明
product_idtruestring项目 ID,对应 AccountID
data_source_idtruestring数据源 ID,对应 DataSourceID
server_hosttruestring数据收集服务域名,对应 ServerHost ,请参考运维手册或联系技术支持获取
consumerfalseobject用于配置事件的发送逻辑

代码示例

from growingio_tracker import GrowingTracker

# 方式1:使用默认配置
growing_tracker = GrowingTracker('<product_id>', '<data_source_id>', '<server_host>')

# 方式2: 自定义发送策略
from growingio_tracker import DefaultConsumer
default_consumer = DefaultConsumer('<product_id>', '<data_source_id>', '<server_host>')
growing_tracker = GrowingTracker.consumer(default_consumer)

发送策略

在 Python Sdk 中,提供了不同的事件发送策略,我们可以通过设置不同的策略来配置事件的发送逻辑.

默认策略配置参数

参数必选类型默认值说明
product_idtruestring项目 ID,见数据源配置
data_source_idtruestring数据源 ID,见数据源配置
server_hosttruestring数据收集服务域名,请参考运维手册或联系技术支持获取
data_parserfalseobjectJsonParser数据格式处理逻辑,默认处理JSON格式
retry_limitfalseint3数据上传重试次数
request_timeoutfalseint5数据请求超时时间,默认5秒
retry_backoff_factorfalsefloat0.25数据上传重试间隔,默认0.25秒
verify_certfalseboolTrue网络请求证书验证

立即发送(默认)

当通过 API 传入事件时,SDK会立即将事件上报。

from growingio_tracker import DefaultConsumer

# 生成事件发送策略
default_consumer = DefaultConsumer('<product_id>', '<data_source_id>', '<server_host>')

# 通过传入发送策略来初始化 SDK
growing_tracker = GrowingTracker.consumer(default_consumer)

队列发送

只有当队列事件数目达到设置的队列最大值时才会上传数据。

额外参数必选类型默认值说明
max_sizefalseint500当队列数据达到设置的最大值时,打包上传事件信息,默认最大值为500条
from growingio_tracker import BufferedConsumer

buffer_consumer = BufferedConsumer('<product_id>', '<data_source_id>', '<server_host>')
growing_tracker = GrowingTracker.consumer(buffer_consumer)

异步队列发送

队列发送的异步版,当队列事件数目达到设置的队列最大值时或者超过设置的定时时间后才会上传数据。

额外参数必选类型默认值说明
flush_afterfalseint10每隔一定时间发送队列中的数据,默认时间为10秒
max_sizefalseint500当队列数据达到设置的最大值时,打包上传事件信息,默认最大值为500条
from growingio_tracker import AsyncBufferedConsumer

async_consumer = AsyncBufferedConsumer('<product_id>', '<data_source_id>', '<server_host>')
growing_tracker = GrowingTracker.consumer(async_consumer)

日志测试

用于打印日志,请在测试环境中使用。

from growingio_tracker import DebugConsumer

# 生成事件发送策略
debug_consumer = DebugConsumer('<product_id>', '<data_source_id>', '<server_host>')

# 通过传入发送策略来初始化 SDK
growing_tracker = GrowingTracker.consumer(debug_consumer)

数据格式

python sdk 可以通过配置数据解析器来改变数据上传的格式,默认为JSON格式。除此之外,SDK 中额外提供了 snappy 的处理逻辑。

使用 Snappy 压缩数据

要求安装 python-snappy 依赖库 : pip install python-snappy

参数必选类型默认值说明
crypt_datafalseboolFalse是否对数据进行异或加密(只对python3+有效)
from growingio_tracker import DefaultConsumer
from growingio_tracker_snappy import SnappyParser

data_parser = SnappyParser()
default_consumer = DefaultConsumer('<product_id>', '<data_source_id>', '<server_host>', data_parser)
growing_tracker = GrowingTracker.consumer(default_consumer)

使用 protobuf 压缩数据

要求安装 protobuf 依赖库 : pip install protobuf

from growingio_tracker import DefaultConsumer
from growingio_tracker_protobuf import ProtobufParser

data_parser = ProtobufParser()
default_consumer = DefaultConsumer('<product_id>', '<data_source_id>', '<server_host>', data_parser)
growing_tracker = GrowingTracker.consumer(default_consumer)

API接口使用

埋点事件

发送一个埋点事件。在添加发送的埋点事件代码之前,需在CDP平台事件管理界面创建埋点事件以及关联事件属性

info
  • 当需要标记用户ID类型时,请先进行规划,并在平台的数据中心,添加新的用户身份类型,再设置userkey,误设会影响数据质量。

参数说明

参数是否必选类型默认值说明
event_nametruestring埋点事件标识符
event_timefalselong事件发生时间(毫秒);
需要开启“自定义event_time上报”功能方可生效,请联系技术支持确认
anonymous_idfalsestring访问用户ID,与登录用户ID,不能同时为空
login_user_keyfalsestring登录用户KEY (选填,需有规划并在平台配置后再上报),传此参数时,同时需传登录用户ID
login_user_idfalsestring登录用户ID,与访问用户ID,不能同时为空
attributesfalsedictNone事件发生时,所伴随的维度信息;
value支持 string|double|int|array,array中元素支持string|double|int

代码示例

growing_tracker.track_custom_event("test", login_user_id='cpacm', login_user_key='email',
attributes={'name': 'cpacm', 'age': '100', 'education': ['本科','硕士']})
info

详细使用示例:埋点事件示例

登录用户属性事件

以登录用户的身份定义登录用户属性,比如年龄、性别、会员等级等,用于用户信息相关分析
在添加登录用户属性代码之前,需要在CDP平台用户管理界面中创建用户属性

info
  • 当需要标记用户ID类型时,请先进行规划,并在平台的数据中心,添加新的用户身份类型,再设置userkey,误设会影响数据质量。

参数说明

参数必选类型默认值说明
login_user_idtruestring登录用户ID,与访问用户ID,不能同时为空
login_user_keyfalsestring登录用户KEY (选填,需有规划并在平台配置后再上报),传此参数时,同时需传登录用户ID
event_timefalselong当前时间戳(毫秒)
anonymous_idfalsestring访问用户ID,与登录用户ID,不能同时为空
attributesfalsedictNone用户属性维度信息;
value支持 string|double|int|array,array中元素支持string|double|int
代码示例
growing_tracker.track_user(login_user_id='user', login_user_key='email',
attributes={'name': 'cpacm', 'age': '100', 'education': ['本科','硕士']})
info

详细使用示例:用户属性事件示例

维度表

上传一个维度表记录。在添加所需要上传维度表记录代码之前,需要在维度表管理界面中创建对应维度表及其属性

参数说明

参数必选类型默认值说明
item_idtruestring维度表模型ID(记录ID)
item_keytruestring维度表标识符
item_attrsfalsedictNone维度表属性及值

代码示例

growing_tracker.submit_item('item_id', 'item_key', item_attrs={'attr': 'item'})

集成代码示例一览

# -*- coding: utf-8 -*-

import time
from growingio_tracker import GrowingTracker
from growingio_tracker import DefaultConsumer
from growingio_tracker import BufferedConsumer
from growingio_tracker import AsyncBufferedConsumer
from growingio_tracker_snappy import SnappyParser
from growingio_tracker_protobuf import ProtobufParser

if __name__ == '__main__':

def tracker():
buffer_consumer = BufferedConsumer('bc675c65b3b0290e', '939c0b26233d3ed1', 'http://uat-api.growingio.com')
growing_tracker = GrowingTracker.consumer(buffer_consumer)
message = CustomEventMessage.EventBuilder() \
.set_event_name("tracker_consumer").set_attributes({'num': 3}).set_anonymous_id('python') \
.build()
growing_tracker.track(message)
buffer_consumer.flush()
time.sleep(5)

def tracker_consumer():
buffer_consumer = BufferedConsumer('<product_id>', '<data_source_id>', '<server_host>')
growing_tracker = GrowingTracker.consumer(buffer_consumer)
for num in range(0, 3):
growing_tracker.track_custom_event("tracker_consumer", attributes={'num': num}, anonymous_id='python')
growing_tracker.submit_item('tracker_consumer', 'python', item_attrs={'consumer': 'consumer'})

for num in range(3, 5):
growing_tracker.track_custom_event("tracker_consumer", attributes={'num': num}, anonymous_id='python')

buffer_consumer.flush()
time.sleep(5)


def tracker_user():
growing_tracker = GrowingTracker('<product_id>', '<data_source_id>', '<server_host>')

growing_tracker.track_user(login_user_id='cpacm', login_user_key='cpacm', anonymous_id='python',
attributes={'cpacm': 'name', 'python': 'tracker_user'})

time.sleep(5)


def tracker_test():
growing_tracker = GrowingTracker('<product_id>', '<data_source_id>', '<server_host>')
growing_tracker.track_custom_event("test", attributes={'name': 'cpacm', 'age': '100'},
login_user_id='user', login_user_key='email', anonymous_id='python')

growing_tracker.track_user(login_user_id='user', login_user_key='email', anonymous_id='python',
attributes={'name': 'cpacm', 'age': '100'})
growing_tracker.submit_item('item_key', 'item_name', item_attrs={'attr': 'item'})
time.sleep(5)


def tracker_async():
async_consumer = AsyncBufferedConsumer('<product_id>', '<data_source_id>', '<server_host>')
growing_tracker = GrowingTracker.consumer(async_consumer)
print("<<TEST 1>>\n")
for num in range(0, 3):
growing_tracker.track_custom_event("tracker_async", attributes={'num': num}, anonymous_id='python')
growing_tracker.submit_item('tracker_async', 'python', item_attrs={'consumer': 'consumer'})

time.sleep(3)
print("<<TEST 2>>\n")
growing_tracker.track_user(login_user_id='user', login_user_key='email', anonymous_id='python',
attributes={'name': 'tracker_async', 'age': '100'})

time.sleep(10)
print("<<TEST 3>>")
growing_tracker.track_custom_event("tracker_async", attributes={'num': 'last'}, anonymous_id='python')

time.sleep(15)
async_consumer.stop()
print("<<END>>")


def tracker_snappy():
data_parser = SnappyParser(True)
default_consumer = DefaultConsumer('<product_id>', '<data_source_id>', '<server_host>',
data_parser)
growing_tracker = GrowingTracker.consumer(default_consumer)
growing_tracker.track_custom_event("tracker_snappy", attributes={'name': 'cpacm', 'age': '100','xor':'True'},
anonymous_id='python',
login_user_id='user', login_user_key='email')
time.sleep(5)


def tracker_protobuf():
data_parser = ProtobufParser()
default_consumer = AsyncBufferedConsumer('<product_id>', '<data_source_id>', '<server_host>',
data_parser)
growing_tracker = GrowingTracker.consumer(default_consumer)
growing_tracker.track_custom_event("tracker_protobuf", attributes={'name': 'cpacm', 'age': '100'},
anonymous_id='python',
login_user_id='user', login_user_key='email')

growing_tracker.submit_item('tracker_protobuf', 'python', item_attrs={'consumer': 'consumer'})

time.sleep(5)
for num in range(1, 3):
growing_tracker.track_custom_event("tracker_protobuf", attributes={'num': num}, anonymous_id='python')

time.sleep(15)

tracker()
tracker_test()
tracker_user()
tracker_consumer()
tracker_async()
tracker_snappy()
tracker_protobuf()